#agentes de lenguaje

Saber Preguntar: Clarificación Autogestionada en Agentes Jerárquicos

Un nuevo método permite a los agentes de IA decidir cuándo pedir clarificación, aumentando hasta 16% la exactitud en taxonomías de 30,000 nodos.

2026-06-11 · 3 min

Memoria espacial y oclusión: prueba para agentes de lenguaje

La oclusión demuestra que la geometría potencia la memoria espacial en agentes de lenguaje. Estudio revela mejora del 32% frente al enfoque lineal. ¡Lee más!

2026-06-10 · 1 min

Aprendiendo a retener: optimización segura de memoria para IA

El nuevo marco OSL-MR optimiza la retención de memoria en agentes de lenguaje, superando heurísticas y mejorando precisión con presupuestos ajustados.

2026-06-10 · 4 min

Agente Árbitro: Detectando Desalineación Emergente en Conversaciones

El Agente Árbitro monitoriza conversaciones multi-agente para detectar desalineaciones emergentes con presupuesto limitado. Mejora la seguridad.

2026-06-10 · 2 min

AdaMEM: Memoria Adaptativa en Tiempo de Prueba para Agentes de Lenguaje

AdaMEM: memoria adaptativa durante la inferencia para agentes de lenguaje. Mejora rendimiento hasta 13% en tareas complejas. ¡Descúbrelo!

2026-06-06 · 2 min

De Hackeos de Recompensa a Estados de Riesgo: Monitoreo Contextual en Agentes

Aprende cómo la calibración por contexto y la entropía mejoran la detección de riesgos en agentes LLM frente a hackeos de recompensa.

2026-06-06 · 2 min

ArcANE: ¿Los agentes de rol actúan según su arco narrativo?

ArcANE evalúa si los agentes de rol mantienen la coherencia psicológica según el arco narrativo, en situaciones nuevas. Mejora tus modelos con este benchmark.

2026-06-06 · 3 min

Aprendizaje online de habilidades con recuperación dinámica basada en estado

SGDR revoluciona el aprendizaje de habilidades en agentes web: recuperación dinámica basada en estado mejora un 10% la tasa de éxito en WebArena. ¡Conoce los detalles!

2026-06-04 · 2 min

RGMem: Memoria evolutiva inspirada en renormalización para agentes

RGMem: memoria evolutiva multiescala para agentes conversacionales. Aprende de interacciones pasadas, se adapta a preferencias y supera límites de contexto.

2026-06-03 · 2 min

PieArena: Ranking y Perfil de Agentes de Lenguaje en Negociaciones Realistas

PieArena mide la capacidad de negociación de los LLMs en escenarios reales. GPT-5 iguala o supera a humanos en este benchmark.

2026-06-03 · 2 min

Co-Entrenamiento de Políticas y Modelado del Mundo para Agentes de Lenguaje

Descubre PaW: co-entrenamiento de políticas y modelado del mundo para agentes de lenguaje. Mejora el aprendizaje por refuerzo sin modificar la inferencia.

2026-06-02 · 2 min

AGENTCL: Evaluación rigurosa del aprendizaje continuo en agentes

Descubre AGENTCL, un marco para evaluar cómo los agentes de IA acumulan experiencia y mejoran en tareas. Aprende sobre transferencia de aprendizaje y diseño de memoria.

2026-06-02 · 2 min

Evaluación conductual y representacional de agentes de lenguaje con objetivos

Evaluamos la direccionalidad a objetivos en agentes de lenguaje con análisis conductual y representacional. Descubre cómo entender su comportamiento.

2026-06-01 · 3 min